期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 中文口语理解弱监督训练方法
李艳玲, 颜永红
计算机应用    2015, 35 (7): 1965-1968.   DOI: 10.11772/j.issn.1001-9081.2015.07.1965
摘要603)      PDF (834KB)(532)    收藏

标注数据的获取一直是有监督方法需要面临的一个难题,针对中文口语理解任务中的意图识别研究了结合主动学习和自训练、协同训练两种弱监督训练方法,提出在级联框架下,从关键语义概念识别中获取语义类特征子集和句子本身的字特征子集分别作为两个"视角"的特征进行协同训练。通过在中文口语语料上进行的实验表明:结合主动学习和自训练的方法与被动学习、主动学习相比较,可以最大限度地降低人工标注量;而协同训练在很少的初始标注数据的前提下,利用两个特征子集进行协同训练,最终使得单一字特征子集上的分类错误率平均下降了0.52%。

参考文献 | 相关文章 | 多维度评价
2. 基于类别空间模型的文本倾向性分类方法
李艳玲 戴冠中 朱烨行
计算机应用   
摘要1153)      PDF (603KB)(881)    收藏
在对现有分类方法和文本倾向性分类的复杂性进行分析的基础上,提出了一种基于类别空间模型的文本倾向性分类方法。该方法采用组合特征提取方法,基于词语对类别的倾向性进行分类。实验结果表明该方法有效地提高了倾向性分类的精度和速度。
相关文章 | 多维度评价